Transformers have recently gained attention in the computer vision domain due to their ability to model long-range dependencies. However, the self-attention mechanism, which is the core part of the Transformer model, usually suffers from quadratic computational complexity with respect to the number of tokens. Many architectures attempt to reduce model complexity by limiting the self-attention mechanism to local regions or by redesigning the tokenization process. In this paper, we propose DAE-Former, a novel method that seeks to provide an alternative perspective by efficiently designing the self-attention mechanism. More specifically, we reformulate the self-attention mechanism to capture both spatial and channel relations across the whole feature dimension while staying computationally efficient. Furthermore, we redesign the skip connection path by including the cross-attention module to ensure the feature reusability and enhance the localization power. Our method outperforms state-of-the-art methods on multi-organ cardiac and skin lesion segmentation datasets without requiring pre-training weights. The code is publicly available at https://github.com/mindflow-institue/DAEFormer.
translated by 谷歌翻译
多年来,卷积神经网络(CNN)已成为多种计算机视觉任务的事实上的标准。尤其是,基于开创性体系结构(例如具有跳过连接的U形模型)或具有金字塔池的Artous卷积的深度神经网络已针对广泛的医学图像分析任务量身定制。此类架构的主要优点是它们容易拘留多功能本地功能。然而,作为一般共识,CNN无法捕获由于卷积操作的固有性能的内在特性而捕获长期依赖性和空间相关性。另外,从全球信息建模中获利的变压器源于自我发项机制,最近在自然语言处理和计算机视觉方面取得了出色的表现。然而,以前的研究证明,局部和全局特征对于密集预测的深层模型至关重要,例如以不同的形状和配置对复杂的结构进行分割。为此,本文提出了TransDeeplab,这是一种新型的DeepLab样纯变压器,用于医学图像分割。具体而言,我们用移动的窗口利用层次旋转式变形器来扩展DeepLabV3并建模非常有用的空间金字塔池(ASPP)模块。对相关文献的彻底搜索结果是,我们是第一个用基于纯变压器模型对开创性DeepLab模型进行建模的人。关于各种医学图像分割任务的广泛实验证明,我们的方法在视觉变压器和基于CNN的方法的合并中表现出色或与大多数当代作品相提并论,并显着降低了模型复杂性。代码和训练有素的模型可在https://github.com/rezazad68/transdeeplab上公开获得
translated by 谷歌翻译
在过去的几年中,卷积神经网络(CNN),尤其是U-NET,一直是医学图像处理时代的流行技术。具体而言,开创性的U-NET及其替代方案成功地设法解决了各种各样的医学图像分割任务。但是,这些体系结构在本质上是不完美的,因为它们无法表现出长距离相互作用和空间依赖性,从而导致具有可变形状和结构的医学图像分割的严重性能下降。针对序列到序列预测的初步提议的变压器已成为替代体系结构,以精确地模拟由自我激进机制辅助的全局信息。尽管设计了可行的设计,但利用纯变压器来进行图像分割目的,可能导致限制的定位容量,导致低级功能不足。因此,一系列研究旨在设计基于变压器的U-NET的强大变体。在本文中,我们提出了Trans-Norm,这是一种新型的深层分割框架,它随同将变压器模块合并为标准U-NET的编码器和跳过连接。我们认为,跳过连接的方便设计对于准确的分割至关重要,因为它可以帮助扩展路径和收缩路径之间的功能融合。在这方面,我们从变压器模块中得出了一种空间归一化机制,以适应性地重新校准跳过连接路径。对医学图像分割的三个典型任务进行了广泛的实验,证明了透气的有效性。代码和训练有素的模型可在https://github.com/rezazad68/transnorm上公开获得。
translated by 谷歌翻译
卷积神经网络(CNN)已成为医疗图像分割任务的共识。但是,由于卷积操作的性质,它们在建模长期依赖性和空间相关性时受到限制。尽管最初开发了变压器来解决这个问题,但它们未能捕获低级功能。相比之下,证明本地和全球特征对于密集的预测至关重要,例如在具有挑战性的环境中细分。在本文中,我们提出了一种新型方法,该方法有效地桥接了CNN和用于医学图像分割的变压器。具体而言,我们使用开创性SWIN变压器模块和一个基于CNN的编码器设计两个多尺度特征表示。为了确保从上述两个表示获得的全局和局部特征的精细融合,我们建议在编码器编码器结构的跳过连接中提出一个双层融合(DLF)模块。在各种医学图像分割数据集上进行的广泛实验证明了Hiformer在计算复杂性以及定量和定性结果方面对其他基于CNN的,基于变压器和混合方法的有效性。我们的代码可在以下网址公开获取:https://github.com/amirhossein-kz/hiformer
translated by 谷歌翻译
在数字病理学中,许多图像分析任务是挑战,需要大量的耗时的手动数据注释来应对图像域中的各种可变性来源。基于图像到图像转换的无监督域适应在没有手动开销的情况下通过解决变量,在此字段中获得重要性。在这里,我们通过无监督的污渍到污渍翻译来解决不同组织污渍的变化,以实现深度学习分割模型的无关适用性。我们在肾组织病理学中使用污渍到染色翻译的自行合物,并提出了两种提高平移效果的新方法。首先,我们通过语义指导将先前的分段网络集成到自我监督,以自我监督的应用方向优化的翻译中的优化,第二个,我们将额外的通道纳入翻译输出,以隐含地单独分开的人工元信息,以外地编码用于解决问题。重建。后者对未修饰的Cycreatiman进行了部分优异的性能,但前者在所有污渍中表现最佳,提供了大多数肾脏结构的78%和92%的含量为78%至92%,例如肾小球,小管和静脉。然而,Cyclegans在其他结构的翻译中仅显示了有限的性能,例如,动脉。与原始污渍中的分割相比,我们的研究也发现所有污渍中的所有结构的性能稍低。我们的研究表明,随着目前无监督的技术,似乎不太可能生产通常适用的假污渍。
translated by 谷歌翻译
Fovea本地化是眼科医学图像分析中最受欢迎的任务之一,其中Macula Lutea的中心点的坐标,即Fovea Centris,应基于彩色眼底图像计算。在这项工作中,我们将本地化问题视为分类任务,其中X和Y轴的坐标被认为是目标类。此外,软MAX激活功能和跨熵损失函数的组合被修改为其多尺度变化,以鼓励预测的坐标与地面真理密切相关。基于彩色眼底摄影图像,我们经验证明,所提出的MultiScale Softmax跨熵产生比Vanilla版本更好的性能,而不是Sigmoid激活的平均平方误差,这提供了一种新颖的坐标回归方法。
translated by 谷歌翻译
当前的最新异常检测(AD)方法利用了大规模成像网训练产生的强大表示。然而,灾难性忘记阻止了半监督环境中新数据集上预训练的表示的成功进行微调,因此通常是固定的。在我们的工作中,我们提出了一种新方法来克服灾难性的遗忘,从而成功地对转移学习环境中的AD进行了预先训练的表示。具体而言,我们基于生成和判别建模之间的联系,为正常类诱导多元高斯分布,并将正常图像的Mahalanobis距离与估计分布作为训练目标。我们还建议在验证方案中使用通常用于最小化的替代风险的增强,以检测灾难性遗忘的发作。对公共MVTEC数据集的广泛评估表明,我们的AD任务中的方法可以实现新的最新技术,同时实现与先前的艺术状态相当的异常细分性能。此外,消融研究证明了诱导的高斯分布以及拟议的微调方案在选择增强方面的鲁棒性的重要性。
translated by 谷歌翻译
We consider a semi-supervised $k$-clustering problem where information is available on whether pairs of objects are in the same or in different clusters. This information is either available with certainty or with a limited level of confidence. We introduce the PCCC algorithm, which iteratively assigns objects to clusters while accounting for the information provided on the pairs of objects. Our algorithm can include relationships as hard constraints that are guaranteed to be satisfied or as soft constraints that can be violated subject to a penalty. This flexibility distinguishes our algorithm from the state-of-the-art in which all pairwise constraints are either considered hard, or all are considered soft. Unlike existing algorithms, our algorithm scales to large-scale instances with up to 60,000 objects, 100 clusters, and millions of cannot-link constraints (which are the most challenging constraints to incorporate). We compare the PCCC algorithm with state-of-the-art approaches in an extensive computational study. Even though the PCCC algorithm is more general than the state-of-the-art approaches in its applicability, it outperforms the state-of-the-art approaches on instances with all hard constraints or all soft constraints both in terms of running time and various metrics of solution quality. The source code of the PCCC algorithm is publicly available on GitHub.
translated by 谷歌翻译
空间机器人应用程序(例如,拆除活动空间碎片)(ASDR)需要在启动之前进行代表性测试。在空间中模仿微重力环境的一种常用方法是基于空气的平台,例如欧洲航天局的轨道机器人技术和GNC Lab(ORGL)。这项工作为ORGL的浮动平台提供了控制架构,配备了八个基于螺线管 - 阀门的推进器和一个反应轮。控制体系结构由两个主要组成部分组成:一个轨迹规划师,该轨迹规划师找到了连接两个状态的最佳轨迹和一个遵循任何物理可行轨迹的轨迹追随者。首先在引入的仿真中评估控制器,在查找和跟随轨迹的轨迹中获得100%的成功率,以在蒙特卡罗测试中来源。单个轨迹也成功地是物理系统。在这项工作中,我们展示了控制器拒绝干扰并遵循数十厘米内的直线轨迹的能力。
translated by 谷歌翻译
最近的年度航天器发射以及计划发布的大量发布提出了有关维持所有有关方面空间的可及性的问题。维持空间飞行未来的关键是服务故障的能力 - 并积极从轨道上删除功能失调的航天器。自主执行这些任务的机器人平台是正在进行的研究的主题,因此必须在启动之前进行彻底的测试。对于代表性的系统级测试,欧洲航天局(ESA)使用了轨道机器人技术和GNC Lab(ORGL),这是一个平坦的设施,基于空气的平台在其中表现出三个度的自由浮动行为自由(DOF)。这项工作介绍了测试环境中自由浮动平台的代表性模拟以及用于控制器开发的软件框架。最后,这项工作提出了该框架内的控制器,以查找和遵循任意状态之间的最佳轨迹,该轨迹在模拟和现实中进行了评估。
translated by 谷歌翻译